本文介绍了一种基于条件生成的对抗网络的碰撞频率数据增强方法,以改善碰撞频率模型。通过比较基本SPF(使用原始数据开发)和增强SPF(使用原始数据加合成数据开发)的性能来评估所提出的方法,以便在热点识别性能,模型预测精度和色散参数估计精度方面。使用模拟和现实世界崩溃数据集进行实验。结果表明,通过CGAN的合成崩溃数据具有与原始数据相同的分布,并且在分散参数低时,在几乎所有方面都占据了基础SPF的增强SPF。
translated by 谷歌翻译
基于参数统计模型的经验贝叶斯(EB)方法如负二项式(NB)已广泛用于道路网络安全筛选过程中的排名位点。本文是提出基于条件生成对冲网络(CGAN)的新型非参数EB方法的新型研究,其中提出了一种基于条件生成的对冲网络(CGAN)的模拟频率数据数据。与参数方法不同,在提议的CGAN-EB中,无所决的和独立变量之间不需要预先指定的底层关系,他们能够建模任何类型的分布。该拟议的方法现在应用于从2012年至2017年在华盛顿州的道路段收集的真实数据集。与模型拟合,预测性能和网络筛查结果的Cgan-EB的性能与作为基准的传统方法(NB-EB)进行比较。结果表明,在预测权力和热点识别测试方面,所提出的Cgan-EB方法优于NB-EB。
translated by 谷歌翻译
在本文中,提出了一种称为Cgan-EB的新非参数型经验贝叶斯方法,用于近似经验贝叶斯(EB)估计,这些经验贝叶斯(例如,道路段)中的估计是深度神经网络的建模优势,其性能基于负二项式模型(NB-EB)的传统方法模拟研究比较。 NB-EB使用负二项式模型来模拟崩溃数据,并且是实践中最常见的方法。为了在所提出的Cgan-EB中模拟崩溃数据,使用条件生成的对抗网络,这是一种强大的深度神经网络的方法,可以模拟任何类型的分布。设计并进行了许多仿真实验,以评估不同条件下的Cgan-EB性能,并将其与NB-EB进行比较。结果表明,当条件有利于NB-EB模型时,Cgan-EB执行以及NB-EB的表现(即数据符合NB模型的假设),并且在实验中的实验中占NB-EB的胜度,特别是低于实际遇到的条件样本方式,当碰撞频率不遵循与协变量的对数线性关系。
translated by 谷歌翻译
We study representation learning for efficient imitation learning over linear systems. In particular, we consider a setting where learning is split into two phases: (a) a pre-training step where a shared $k$-dimensional representation is learned from $H$ source policies, and (b) a target policy fine-tuning step where the learned representation is used to parameterize the policy class. We find that the imitation gap over trajectories generated by the learned target policy is bounded by $\tilde{O}\left( \frac{k n_x}{HN_{\mathrm{shared}}} + \frac{k n_u}{N_{\mathrm{target}}}\right)$, where $n_x > k$ is the state dimension, $n_u$ is the input dimension, $N_{\mathrm{shared}}$ denotes the total amount of data collected for each policy during representation learning, and $N_{\mathrm{target}}$ is the amount of target task data. This result formalizes the intuition that aggregating data across related tasks to learn a representation can significantly improve the sample efficiency of learning a target task. The trends suggested by this bound are corroborated in simulation.
translated by 谷歌翻译
Our education system comprises a series of curricula. For example, when we learn mathematics at school, we learn in order from addition, to multiplication, and later to integration. Delineating a curriculum for teaching either a human or a machine shares the underlying goal of maximizing the positive knowledge transfer from early to later tasks and minimizing forgetting of the early tasks. Here, we exhaustively surveyed the effect of curricula on existing continual learning algorithms in the class-incremental setting, where algorithms must learn classes one at a time from a continuous stream of data. We observed that across a breadth of possible class orders (curricula), curricula influence the retention of information and that this effect is not just a product of stochasticity. Further, as a primary effort toward automated curriculum design, we proposed a method capable of designing and ranking effective curricula based on inter-class feature similarities. We compared the predicted curricula against empirically determined effectual curricula and observed significant overlaps between the two. To support the study of a curriculum designer, we conducted a series of human psychophysics experiments and contributed a new Continual Learning benchmark in object recognition. We assessed the degree of agreement in effective curricula between humans and machines. Surprisingly, our curriculum designer successfully predicts an optimal set of curricula that is effective for human learning. There are many considerations in curriculum design, such as timely student feedback and learning with multiple modalities. Our study is the first attempt to set a standard framework for the community to tackle the problem of teaching humans and machines to learn to learn continuously.
translated by 谷歌翻译
我们介绍了新的新闻文章集合,该文章源自伪造和真实的新闻媒体来源,以分析和预测新闻病毒性。与现有的伪造新闻数据集不同,该数据集包含索赔或新闻文章的标题和正文,在此集合中,每篇文章都得到了Facebook参与数的支持,我们认为这是文章病毒性的指标。此外,我们还提供了文章说明和缩略图图像,与该文章在Facebook上共享。这些图像是用对象标签和颜色属性自动注释的。使用基于云的视觉分析工具,还分析了面部的缩略图图像,并用面部属性注释了检测到的面部。我们从经验上研究了该集合对文章病毒性预测的示例任务的使用。
translated by 谷歌翻译
这项工作的目的是探索如何有效有效地将预训练的基础模型适应图像语义分割的各种下游任务。常规方法通常为每个特定数据集微调整个网络,并且存储这些网络的大量参数是繁重的。最近的一些作品试图将一些可训练的参数插入冷冻网络中,以学习有效调整的视觉提示。但是,这些作品显着修改了标准模块的原始结构,使其在许多现有的高速推理设备上无法使用,其中标准模块及其参数已嵌入。为了促进基于及时的语义细分,我们提出了一个新颖的阶段间及时匹配的框架,该框架保持基础模型的原始结构,同时自适应地生成视觉提示,以适应以任务为导向的调整。具体而言,首先将预训练的模型分为多个阶段,其参数被冷冻并共享所有语义分割任务。然后将称为语义意识的提示匹配器的轻巧模块在两个阶段之间介绍给层次上的插值,以在临时语义图的指导下学习每个特定任务的合理提示。这样,我们可以更好地刺激对冷冻模型的预训练的知识,以有效地学习下游数据集的语义概念。在五个基准上进行的广泛实验表明,所提出的方法可以实现参数效率和性能效率之间的有希望的权衡。
translated by 谷歌翻译
早期对卵巢癌的准确检测对于确保对患者的适当治疗至关重要。在早期诊断研究中研究的一线方式中,有从蛋白质质谱中提取的特征。但是,该方法仅考虑光谱响应的特定子集,而忽略了蛋白质表达水平之间的相互作用,这也可以包含诊断信息。我们提出了一种新的模式,该模式通过考虑光谱的自相似性,自动搜索蛋白质质谱以获取歧视性特征。通过对蛋白质质谱的小波分解并估计所得小波系数的能量中的水平衰减速率来评估自相似性。使用距离方差以稳健的方式估算水平的能量,并通过滚动窗口方法在本地估算速率。这导致了一系列速率,可用于表征蛋白质之间的相互作用,这可以表明存在癌症。然后从这些进化速率中选择歧视性描述符,并用作分类特征。拟议的基于小波的特征与现有文献中提出的特征一起使用,用于使用美国国家癌症研究所(American National Cancer Institute)出版的两个数据集,用于卵巢癌的早期诊断。包括新模式的基于小波的特征可改善早期卵巢癌检测的诊断性能。这证明了提出的方式表征新的卵巢癌诊断信息的能力。
translated by 谷歌翻译
全身动态PET中的受试者运动引入了框架间的不匹配,并严重影响参数成像。传统的非刚性注册方法通常在计算上是强度且耗时的。深度学习方法在快速速度方面实现高精度方面是有希望的,但尚未考虑示踪剂分布变化或整体范围。在这项工作中,我们开发了一个无监督的自动深度学习框架,以纠正框架间的身体运动。运动估计网络是一个卷积神经网络,具有联合卷积长的短期记忆层,充分利用动态的时间特征和空间信息。我们的数据集在90分钟的FDG全身动态PET扫描中包含27个受试者。与传统和深度学习基线相比,具有9倍的交叉验证,我们证明了拟议的网络在增强的定性和定量空间对齐方面获得了卓越的性能在显着降低参数拟合误差中。我们还展示了拟议的运动校正方法的潜力来影响对估计参数图像的下游分析,从而提高了将恶性与良性多代谢区域区分开的能力。一旦受过培训,我们提出的网络的运动估计推理时间比常规注册基线快460倍,表明其潜力很容易应用于临床环境中。
translated by 谷歌翻译
Inspired by progress in large-scale language modeling, we apply a similar approach towards building a single generalist agent beyond the realm of text outputs. The agent, which we refer to as Gato, works as a multi-modal, multi-task, multi-embodiment generalist policy. The same network with the same weights can play Atari, caption images, chat, stack blocks with a real robot arm and much more, deciding based on its context whether to output text, joint torques, button presses, or other tokens. In this report we describe the model and the data, and document the current capabilities of Gato.
translated by 谷歌翻译